智能论文笔记

Identifying the Risks of Chronic Diseases Using BMI Trajectories

Md Mozaharul Mottalib , Jessica C Jones-Smith , Bethany Sheridan , Rahmatollah Beheshti

分类：机器学习

2021-11-09

肥胖是一个重大的健康问题，增加了各种主要慢性病的风险，如糖尿病，癌症和中风。虽然通过横断面BMI录音识别的肥胖作用已经过分研究，但BMI轨迹的作用远远不大。在这项研究中，我们利用从大型和地理位置的EHR数据集中提取的BMI轨迹捕获大约200万个人的健康状况为期六年的健康状况。我们根据BMI轨迹定义九个新的可解释和基于证据的变量，以使用K-Means聚类方法将患者聚类为子组。我们在人口统计学，社会经济和生理测量变量方面彻底审查了每个集群特征，以指定簇中患者的不同性质。在我们的实验中，已被重新建立肥胖，高血压，阿尔茨海默和痴呆症的肥胖，高血压，阿尔茨海默氏症和痴呆症的直接关系，并且已经发现有几种慢性疾病的特异性特征的不同簇符合或与现有的知识体系互补。

translated by 谷歌翻译

Identifying the Leading Factors of Significant Weight Gains Using a New Rule Discovery Method

Mina Samizadeh , Jessica C Jones-Smith , Bethany Sheridan , Rahmatollah Beheshti

分类：机器学习 | 人工智能

2021-11-04

超重和肥胖仍然是一个主要的全球性公共健康问题，并确定增加未来体重增加风险的个性化模式在预防肥胖症和许多与肥胖症相关的次螯症方面具有至关重要的作用。在这项工作中，我们使用规则发现方法来研究这个问题，通过呈现提供真正的解释性和同时优化所识别模式的准确性（经常正确）的准确性（适用于许多样本）的方法来研究这个问题。具体而言，我们扩展了一个已建立的子组 - 发现方法以生成类型X-> Y的所需规则，并显示如何从X侧提取最高特征，作为Y的最佳预测因子。在我们的肥胖问题中，X是指来自非常大的和多站点EHR数据的提取功能，y表示大量的重量。使用我们的方法，我们还广泛地比较了由个人性别，年龄，种族，保险类型，邻里类型和收入水平决定的22层模式中的模式中的差异和不平等。通过广泛的实验，我们对未来危险体重增加的预测变量显示出新的和互补结果。

translated by 谷歌翻译

Detecting Shortcuts in Medical Images - A Case Study in Chest X-rays

Amelia Jiménez-Sánchez , Dovile Juodelye , Bethany Chamberlain , Veronika Cheplygina

分类：计算机视觉

2022-11-08

The availability of large public datasets and the increased amount of computing power have shifted the interest of the medical community to high-performance algorithms. However, little attention is paid to the quality of the data and their annotations. High performance on benchmark datasets may be reported without considering possible shortcuts or artifacts in the data, besides, models are not tested on subpopulation groups. With this work, we aim to raise awareness about shortcuts problems. We validate previous findings, and present a case study on chest X-rays using two publicly available datasets. We share annotations for a subset of pneumothorax images with drains. We conclude with general recommendations for medical image classification.

translated by 谷歌翻译

Automatic Assessment of Infant Face and Upper-Body Symmetry as Early Signs of Torticollis

Michael Wan , Xiaofei Huang , Bethany Tunik , Sarah Ostadabbas

分类：计算机视觉

2022-10-26

We apply computer vision pose estimation techniques developed expressly for the data-scarce infant domain to the study of torticollis, a common condition in infants for which early identification and treatment is critical. Specifically, we use a combination of facial landmark and body joint estimation techniques designed for infants to estimate a range of geometric measures pertaining to face and upper body symmetry, drawn from an array of sources in the physical therapy and ophthalmology research literature in torticollis. We gauge performance with a range of metrics and show that the estimates of most these geometric measures are successful, yielding strong to very strong Spearman's $\rho$ correlation with ground truth values. Furthermore, we show that these estimates, derived from pose estimation neural networks designed for the infant domain, cleanly outperform estimates derived from more widely known networks designed for the adult domain

translated by 谷歌翻译

Characterizing narrative time in books through fluctuations in power and danger arcs

Mikaela Irene Fudolig , Thayer Alshaabi , Kathryn Cramer , Christopher M. Danforth , Peter Sheridan Dodds

分类：自然语言处理

2022-08-19

尽管最近的研究集中在量化单词用法上以找到叙事情感弧的整体形状，但叙事中叙事的某些特征仍有待探索。在这里，我们通过找到单词用法中波动开始相关的文本长度来表征亚叙事的叙事时间尺度。我们代表30,000多个项目Gutenberg书籍作为时间序列使用OusiOmetrics，这是一个具有基本含义的功率破坏者框架，本身是对价价 - 宽松义务框架的重新解释，这些框架源自语义差异。我们使用经验模式分解将每本书的力量和危险时间序列分解为组成振荡模式和非振荡趋势的总和。通过将原始力量和危险时间序列的分解与从洗牌文本中得出的分解，我们发现较短的书籍仅显示出一般趋势，而较长的书籍除了一般趋势外，还具有波动，类似于子图在一个中的弧线中的弧线。总体叙事弧。这些波动通常有几千个单词的时期，无论书籍长度或库分类代码如何，但根据书的内容和结构而有所不同。我们的方法提供了一种数据驱动的denoisising方法，可用于各种长度的文本，与使用大型窗口尺寸的更传统的方法相反，该方法可能会无意中平滑相关信息，尤其是对于较短的文本而言。

translated by 谷歌翻译

Computer Vision to the Rescue: Infant Postural Symmetry Estimation from Incongruent Annotations

Xiaofei Huang , Michael Wan , Lingfei Luan , Bethany Tunik , Sarah Ostadabbas

分类：计算机视觉

2022-07-19

双边姿势对称性是自闭症谱系障碍（ASD）的潜在风险标志物以及婴儿中先天性肌肉核核糖（CMT）的症状的关键作用，但是当前评估对称性的方法需要费力的临床专家评估。在本文中，我们开发了一个基于计算机视觉的婴儿对称评估系统，利用婴儿的3D人姿势估计。通过对人类角度和对称性评级的调查，我们的发现对我们的系统进行评估和校准，使这种评级表现出较低的评价者可靠性。为了纠正这一点，我们开发了一个贝叶斯的估计量，该估计量是从可犯错的人类评估者的概率图形模型中得出的。我们显示，在预测贝叶斯骨料标签方面，3D婴儿姿势估计模型可以在接收器工作特征曲线性能下实现68％的面积，而2D婴儿姿势估计模型仅为61％，而3D成人姿势估计模型的61％和60％，强调了3D姿势和婴儿领域知识在评估婴儿身体对称性方面的重要性。我们的调查分析还表明，人类评分易受较高的偏见和不一致性的影响，因此，我们的最终基于3D姿势的对称评估系统是校准的，但没有直接受到贝叶斯汇总人类评分的直接监督，从而产生了更高的一致性和较低水平的水平和较低的水平。 LIMB间评估偏见。

translated by 谷歌翻译

Learning Safe, Generalizable Perception-based Hybrid Control with Certificates

Charles Dawson , Bethany Lowenkamp , Dylan Goff , Chuchu Fan

分类：机器人

2022-01-04

许多机器人任务需要高维传感器，如相机和激光雷达，以导航复杂的环境，但是在这些传感器周围开发认可的安全反馈控制器仍然是一个具有挑战性的公开问题，特别是在涉及学习时的开放问题。以前的作品通过分离感知和控制子系统并对感知子系统的能力做出强烈的假设来证明了感知反馈控制器的安全性。在这项工作中，我们介绍了一种新的启用学习的感知反馈混合控制器，在那里我们使用控制屏障函数（CBF）和控制Lyapunov函数（CLF）来显示全堆叠感知反馈控制器的安全性和活力。我们使用神经网络直接在机器人的观察空间中学习全堆栈系统的CBF和CLF，而无需承担基于感知的状态估计器。我们的混合控制器称为基因座（使用切换启用了学习的观察反馈控制），可以安全地导航未知的环境，始终如一地达到其目标，并将安全性安全地概括为培训数据集之外的环境。我们在模拟和硬件中展示了实验中的轨迹，在那里它使用LIDAR传感器的反馈成功地导航变化环境。

translated by 谷歌翻译

A Novel Corpus of Discourse Structure in Humans and Computers

Babak Hemmatian , Sheridan Feucht , Rachel Avram , Alexander Wey , Muskaan Garg , Kate Spitalnic , Carsten Eickhoff , Ellie Pavlick , Bjorn Sandstede , Steven Sloman

分类：自然语言处理

2021-11-10

我们介绍了445名人员和计算机生成的文件的新型语料库，包括约27,000个条款，用于语义条款类型和相干关系，允许人工和自然话语模式的细节比较。该语料库涵盖了正式和非正式的话语，并包含使用微调GPT-2生成的文件（Zellers等，2019）和GPT-3（棕色等，2020）。我们通过提供初步证据，展示该语料库的有用性，通过提供初步证据，以提供较少，更短，更频繁的通电话条款关系与计算机生成的叙述和论点的较低质量相关。

translated by 谷歌翻译

AutoDEUQ: Automated Deep Ensemble with Uncertainty Quantification

Romain Egele , Romit Maulik , Krishnan Raghavan , Bethany Lusch , Isabelle Guyon , Prasanna Balaprakash

分类：机器学习

2021-10-26

深度神经网络是各种任务的强大预测因子。但是，它们不会直接捕捉不确定性。使用神经网络集合来量化不确定性与基于贝叶斯神经网络的方法具有竞争力，同时受益于更好的计算可扩展性。然而，神经网络的构建集合是一个具有挑战性的任务，因为除了为整个集合的每个成员选择正确的神经结构或超参数之外，还有增加训练每个模型的成本。我们提出了一种自动化方法，用于生成深神经网络的集合。我们的方法利用联合神经结构和封锁统计数据搜索来生成合奏。我们使用总方差定律来分解深度集成的预测方差，进入炼层（数据）和认知（模型）的不确定性。我们展示了AutodeUQ优于概率的概率BackProjagation，Monte Carlo辍学，深组合，无分配的集合以及多元回归基准的超集合方法。

translated by 谷歌翻译

Augmenting semantic lexicons using word embeddings and transfer learning

Thayer Alshaabi , Colin M. Van Oort , Mikaela Irene Fudolig , Michael V. Arnold , Christopher M. Danforth , Peter Sheridan Dodds

分类：自然语言处理 | 机器学习

2021-09-18

情绪感知智能系统对于广泛的应用是必不可少的。这些系统由语言模型驱动，这主要落入两个范式：基于词汇和上下文。虽然最近的上下文模型越来越占主导地位，但由于它们的可解释性和易用性，我们仍然可以看到基于词汇的模型的需求。例如，基于词汇的模型允许研究人员容易地确定哪些单词和短语对测量情绪的变化有贡献。任何基于词汇的方法的挑战是，词典需要通过新的单词和表达进行常规扩展。在这里，我们提出了两个用于自动词典扩展的模型。我们的第一个模型建立了一种基线，采用简单而浅的神经网络，使用非上下文方法初始化了预先训练的单词嵌入。我们的第二种模式改进了我们的基线，具有深度变压器的网络，它带来了估计其词汇极性的单词定义。我们的评估表明，两种模型都能够以与亚马逊机械土耳其人的评论者相似的准确度，但是在成本的一小部分中，可以获得类似的准确性。

translated by 谷歌翻译